AI资讯新闻榜单内容搜索- DeepSeek

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

8376 点击 2026-05-07 10:16

DeepSeek首轮融资曝光，估值450亿美元

据金融时报的最新消息，多家机构目前正寻求领投 DeepSeek 的首轮融资。如果谈判顺利，DeepSeek 在本轮的估值将达到约 450 亿美元。短短几周内，DeepSeek 的估值就从刚开始被爆料的 200 亿美元一路狂飙翻倍。

来自主题: AI资讯

9315 点击 2026-05-06 16:46

DeepSeek做大→Mega MoE，Tri Dao团队加快→SonicMoE

近日，由普林斯顿大学 Tri Dao（FlashAttention 的一作）和加州大学伯克利分校 Ion Stoica 领导的一个联合研究团队也做出了一个超快的索尼克：SonicMoE。据介绍，SonicMoE 能在英伟达 Blackwell GPU 上以峰值吞吐量运行！并且运算性能超过了 DeepSeek 之前开源并引发巨大轰动的 DeepGEMM。

来自主题: AI技术研报

7986 点击 2026-05-04 10:17

等 DeepSeek 回复的 30 秒，是手机最好玩的半小时

你要是问当今互联网最神秘、最玄学、连量子力学都解释不清的「时空裂缝」在哪里？它不在百慕大，也不在诺兰导演的电影里，而是在你的 DeepSeek、Claude 或者 ChatGPT 正在思考的过程里。

来自主题: AI资讯

8420 点击 2026-05-02 10:59

美团万亿级大模型LongCat-2.0-Preview 开启内测，训推全程用国产芯片

一边是 DeepSeek。2026 年 4 月 24 日，正式发布新一代模型DeepSeek-V4 系列预览版，并同步开源。另一边，美团闷声干了件大事——用全国产算力集群，训练出了万亿参数大模型 LongCat-2.0 系列预览版（ LongCat-2.0-Preview ）。

来自主题: AI资讯

9302 点击 2026-05-01 13:34

刚刚，DeepSeek多模态技术范式公布，以视觉原语思考

刚刚，DeepSeek 在 Github 上正式发布了多模态模型，公布了背后的技术报告。实打实的新鲜出炉！而且是开创性的推理范式。下面我们就基于 DeepSeek 这篇技术报告，具体看看 DeepSeek、北京大学、清华大学又创造了怎样的奇迹。

来自主题: AI技术研报

9422 点击 2026-04-30 20:24

刚刚，DeepSeek大更新！终于「开眼」了| 附大量实测

就在刚刚， DeepSeek 上线了识图模式，显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力，终于来了！目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式，APPSO 第一时间给大家进行了实测。

来自主题: AI资讯

8481 点击 2026-04-29 17:54

扒完 DeepSeek V4 报告，我翻出了这个隐藏彩蛋

今天上午，DeepSeek V4 发布，直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候，在训练层面看到了一个被大部分人滑过去的名词：Muon 优化器。

来自主题: AI技术研报

8868 点击 2026-04-25 10:12

智源：FlagOS完成DeepSeekV4八款芯片Day0 适配，实现三重技术突破

由智源研究院牵头研发的众智 FlagOS 第一时间对两个“巨无霸”模型进行全量适配，已经完成 DeepSeek-V4-Flash 在8款以上 AI 芯片上的全量适配与推理部署，包括海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数、英伟达（FP8）等芯片。FlagOS 同时正在推进 DeepSeek-V4-Pro 模型在多个芯片的迁移适配，晚些时间开源出来，敬请期待。

来自主题: AI资讯

8248 点击 2026-04-24 16:23

DeepSeek-V4 预览版：迈入百万上下文普惠时代

今天，我们全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本：

来自主题: AI资讯

9076 点击 2026-04-24 11:20